unstructred data DASK #3 | Bag & Cluster Basic str과 같은 unstructured | semi-structured data는 Dask bags에 저장 text operation은 GIL을 자동적으로 활성화 따라서 Dask는 tex데이터를 처리하기 위해 Default적으로 Parallel Processing 사용 : process간 data copy를 하는데 시간을 많이 할애하기 때문에 lazily하게 load하는게 좋음 db... unstructred datadask bagdask bag
DASK #3 | Bag & Cluster Basic str과 같은 unstructured | semi-structured data는 Dask bags에 저장 text operation은 GIL을 자동적으로 활성화 따라서 Dask는 tex데이터를 처리하기 위해 Default적으로 Parallel Processing 사용 : process간 data copy를 하는데 시간을 많이 할애하기 때문에 lazily하게 load하는게 좋음 db... unstructred datadask bagdask bag